desain antarmuka suara atau vui

tantangan psikologis bicara pada benda mati

Pernahkah kita berada di dalam lift yang sepi, lalu dengan suara setengah berbisik kita berkata pada ponsel, "Tolong pasang alarm jam lima pagi"? Jika pernah, sadarkah teman-teman apa yang biasanya kita lakukan sedetik setelah kalimat itu terucap? Ya, kita menoleh ke kanan dan ke kiri. Kita memastikan tidak ada manusia lain yang melihat. Ada rasa canggung yang aneh. Padahal, kita hanya sedang menggunakan fitur Voice User Interface (VUI) atau antarmuka suara seperti Siri, Alexa, atau Google Assistant. Mengapa kita merasa sedikit bodoh saat berbicara dengan benda mati, padahal benda itu didesain khusus untuk mendengarkan kita?

Mari kita mundur sejenak ke masa lalu. Secara historis, otak manusia sebenarnya sangat suka memberikan sifat manusiawi pada benda mati. Di dunia psikologi, fenomena ini disebut antropomorfisme. Bangsa Viking memberi nama pada pedang mereka. Para pelaut menganggap kapal mereka sebagai wanita yang harus dilindungi. Kita bahkan sering tanpa sadar mengelus dasbor mobil saat berhasil melewati jalanan menanjak yang sulit. Memberi nyawa pada benda mati adalah cara leluhur kita berdamai dengan dunia yang tidak tertebak. Namun, ada satu batasan yang selama ribuan tahun tidak pernah kita lewati: kita tidak pernah berharap benda mati itu menjawab. Dalam sejarah evolusi manusia, jika kita berbicara dengan batu dan batu itu membalas ucapan kita, pilihannya hanya dua. Kita sedang menyaksikan keajaiban magis, atau kita sedang kehilangan kewarasan. Kini, perusahaan teknologi raksasa meminta kita melakukan hal "gila" tersebut setiap hari.

III

Masalahnya, desain antarmuka suara ini sering kali berbenturan keras dengan cara kerja otak kita. Dalam ilmu linguistik dan sosiologi, percakapan antarmanusia itu bukanlah sekadar pertukaran data. Ia adalah sebuah tarian rumit yang melibatkan turn-taking atau giliran bicara. Saat kita mengobrol dengan teman, jeda normal antara satu orang selesai bicara dan orang lain menanggapi hanyalah sekitar 200 milidetik. Sangat cepat. Namun saat kita bertanya pada smart speaker, sering kali ada jeda pemrosesan selama satu hingga dua detik. Jeda latency ini mungkin sepele bagi teknisi komputer, tetapi bagi otak primata kita, jeda itu membunyikan alarm kecemasan. Saat lawan bicara diam terlalu lama, insting sosial kita panik. Apakah dia marah? Apakah ucapan saya salah? Selain itu, perhatikan nada bicara kita. Saat bicara dengan mesin, kita otomatis menggunakan nada suara robotik yang kaku, memenggal kata satu demi satu. Mengapa kita yang harus mengadaptasikan suara kita demi mesin, dan bukan sebaliknya? Apa sebenarnya yang membuat pengalaman ini terasa begitu menguras emosi?

Di sinilah kita sampai pada inti psikologis dari kecanggungan tersebut. Berbicara dengan suara lantang adalah salah satu bentuk kerentanan tertinggi manusia. Suara adalah alat evolusi kita untuk mencari koneksi, meminta pertolongan, dan mengekspresikan diri. Saat kita berbicara, kita membuka diri dan mengharapkan timbal balik berupa validasi sosial. Nah, ketika kita sudah membuang rasa gengsi untuk bicara pada sebuah silinder plastik di ruang tamu, lalu mesin itu menjawab, "Maaf, saya tidak mengerti maksud Anda," apa yang terjadi? Bagi komputer, itu hanyalah kegagalan memproses algoritma. Namun bagi otak emosional kita, itu diterjemahkan sebagai penolakan sosial. Sebuah micro-rejection. Otak kita merasa tidak didengar, tidak dipahami, dan diabaikan. Para desainer VUI sebenarnya sedang menghadapi tugas yang nyaris mustahil. Mereka tidak hanya menulis kode software; mereka sedang mencoba meretas jutaan tahun evolusi psikologi manusia. Mereka mencoba menanamkan empati dan rasa percaya ke dalam sirkuit silikon yang dingin.

Jadi, teman-teman, desain antarmuka suara pada akhirnya bukanlah sekadar tantangan teknologi. Ia adalah cermin yang memantulkan betapa dalamnya kebutuhan kita sebagai manusia untuk didengar dan dipahami. Lain kali kita merasa konyol atau frustrasi karena harus berteriak mengulang perintah kepada ponsel atau smart tv kita, maafkanlah diri kita sendiri. Kita tidak aneh. Kita hanya sedang menjadi manusia seutuhnya. Otak kita dirancang untuk mencari koneksi yang hangat di dunia yang nyata, bukan sekadar pantulan suara dari kecerdasan buatan. Mungkin suatu hari nanti, para desainer teknologi akan berhasil menjembatani celah ini. Namun hingga hari itu tiba, mari kita hargai kerumitan batin kita sendiri, dan mungkin, mari lebih sering mengobrol dengan sesama manusia yang benar-benar bisa tertawa mendengar lelucon kita.